AI资讯新闻榜单内容搜索-AI 研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI 研究
姚顺雨提到的「AI下半场」,产品评估仍被误解

姚顺雨提到的「AI下半场」,产品评估仍被误解

姚顺雨提到的「AI下半场」,产品评估仍被误解

前段时间,OpenAI 研究员姚顺雨发表了一篇主题为「AI 下半场」的博客。其中提到,「接下来,AI 的重点将从解决问题转向定义问题。在这个新时代,评估的重要性将超过训练。我们需要重新思考如何训练 AI 以及如何衡量进展,这可能需要更接近产品经理的思维方式。」(参见《清华学霸、OpenAI 姚顺雨:AI 下半场开战,评估将比训练重要》)

来自主题: AI资讯
5791 点击    2025-06-03 13:40
通专融合,思维链还透明,上海AI Lab为新一代大模型打了个样

通专融合,思维链还透明,上海AI Lab为新一代大模型打了个样

通专融合,思维链还透明,上海AI Lab为新一代大模型打了个样

OpenAI 研究员姚顺雨近期发布文章,指出:AI 下半场将聚焦问题定义与评估体系重构。在 AI 发展新阶段,行业需要通过设计更有效的模型评测体系,弥补 AI 能力与真实需求的差距。

来自主题: AI技术研报
8788 点击    2025-05-24 15:33
9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来

9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来

9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来

近日,在红杉资本主办的 AI Ascent 上,OpenAI 研究科学家 Dan Roberts 做了主题为「接下来的未来 / 扩展强化学习」的演讲,其上传到 YouTube 的版本更是采用了一个更吸引人的标题:「9 年实现 AGI?OpenAI 的 Dan Roberts 推测将如何模拟爱因斯坦。」

来自主题: AI资讯
6725 点击    2025-05-10 17:51
OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!

PaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理解研究论文、独立开发代码并执行实验以复现研究结果。

来自主题: AI技术研报
7057 点击    2025-04-03 10:57
今天的 AI 创业,正在重复《苦涩的教训》

今天的 AI 创业,正在重复《苦涩的教训》

今天的 AI 创业,正在重复《苦涩的教训》

「70 年的 AI 研究历史告诉我们一个最重要的道理:依靠纯粹算力的通用方法,最终总能以压倒性优势胜出。」如今,似乎可以重新再聊下这个话题。比如前两天我们发的 Agent 文章里的观点:未来 AI 智能体的发展方向还得是模型本身,而不是工作流(Work Flow)。

来自主题: AI资讯
7728 点击    2025-03-26 21:01
万字长文解读Scaling Law的一切,洞见LLM的未来

万字长文解读Scaling Law的一切,洞见LLM的未来

万字长文解读Scaling Law的一切,洞见LLM的未来

近日,资深机器学习研究科学家 Cameron R. Wolfe 更新了一篇超长的博客文章,详细介绍了 LLM scaling 的当前状况,并分享了他对 AI 研究未来的看法。

来自主题: AI技术研报
5997 点击    2025-02-02 17:39
从 Anthropic,看见 Google 曾经的样子

从 Anthropic,看见 Google 曾经的样子

从 Anthropic,看见 Google 曾经的样子

Anthropic 的崛起是2024年全球 AI 产业最受瞩目的现象之一,它是 OpenAI 强有力的挑战者,令很多厌倦了 OpenAI 式虚张声势和夸大其词的 AI 研究者和开发者耳目一新。

来自主题: AI资讯
5203 点击    2025-01-04 11:44
Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

对 AI 研究者来说,数学既是一类难题,也是一个标杆,能够成为衡量 AI 技术的发展重要尺度。近段时间,随着 AI 推理能力的提升,使用 AI 来证明数学问题已经成为一个重要的研究探索方向。

来自主题: AI技术研报
6442 点击    2024-12-24 15:37
The Bitter Lesson(苦涩的教训)

The Bitter Lesson(苦涩的教训)

The Bitter Lesson(苦涩的教训)

Ilya Sutskever(前 OpenAI 联合创始人兼首席科学家)在前几天召开的 NeurIPS 会议上表示,大模型的预训练已经走到了尽头。而 Noam Brown(OpenAI 研究员,曾带领团队开发出在德州扑克中战胜职业选手的 AI 系统 Pluribus)在近期关于 OpenAI O1 发布的采访中提到,提升 Test-Time Compute 是提升大模型答案质量的关键。

来自主题: AI资讯
7164 点击    2024-12-17 10:20